总览
本章节范围:LLM agent 的记忆系统——跨上下文窗口的信息存储、检索与遗忘 目标读者:设计 agent harness、需要让 agent 跨会话保持状态的工程师
范围与边界 (Scope)
- 包含:记忆分类体系、上下文压缩 (compaction)、文件型外置记忆、向量检索记忆、记忆操作生命周期、生产记忆系统对标、记忆安全
- 不包含:
上下文工程 vs 记忆系统的划界:
02-上下文工程管单次窗口内放什么、怎么组织;本章管跨窗口怎么存、怎么取、怎么遗忘。compaction 处在交界,划归本章 (它本质是把历史转成可持久记忆)。
名词定义
| 名词 | 定义 |
|---|---|
| 工作记忆 (working memory) | 当前上下文窗口内激活的信息,生命周期等于一个决策周期 |
| 情节记忆 (episodic) | 来自过往决策周期的具体经验:事件历史、轨迹 |
| 语义记忆 (semantic) | 去语境化的抽象知识:世界知识、自身知识 |
| 程序性记忆 (procedural) | "怎么做"的知识,含模型参数隐式部分与代码/skills 显式部分 |
| compaction (上下文压缩) | 历史被模型压成摘要、同一 agent 以摘要为起点续跑;有损 |
| context-reset | 终止当前会话,用结构化 handoff 文档启动新 agent 续跑 |
| context anxiety | 模型临近它认为的上下文上限时过早结束任务的行为 |
| handoff (交接文档) | 记录状态、决策、未完成任务的文件,桥接跨会话 agent |
| write/select/compress/isolate | 上下文操作四原语:外存写入 / 检索回取 / 压缩 / 隔离 |
| 文件型外置记忆 | 用文件系统 (CLAUDE.md/MEMORY.md 等) 存记忆,可检视、可 git |
| 多信号检索 (multi-signal) | 语义 + 关键词 (BM25) + 实体并行打分后融合的检索 |
| ANN 索引 | 近似最近邻索引 (Flat/IVF/HNSW/PQ),在召回率/延迟/内存间权衡 |
| 两阶段检索 | bi-encoder 粗召回 + cross-encoder 精排的检索漏斗 |
| RRF | Reciprocal Rank Fusion,按排名融合多路检索结果 |
| ADD/UPDATE/DELETE/NOOP | 记忆写入时 LLM 对新事实判定的四种操作 |
| LongMemEval / LoCoMo | 长期对话记忆评测基准,测信息抽取/时序推理等能力 |
| 记忆投毒 (memory poisoning) | 在写入阶段注入恶意内容污染 agent 持久记忆 |
| 记忆主权 (mnemonic sovereignty) | 对记忆"何可写、谁可读、何时改、哪可忘、哪可审计"的可验证治理能力 |
@tbl-agent-memory-glossary 记忆系统核心名词定义:工作记忆、情节记忆、语义记忆、程序性记忆等术语释义
本章节所有文档默认这些名词已定义,概念型文档只在正文首现处补充本文新引入的概念。
子文档索引 (Index)
- 02-记忆分类体系 — 表示 / 时间 / 内容 / 控制四个正交分类维度
- 03-compaction-与上下文压缩 — 三策略、触发机制与 context anxiety
- 04-文件型外置记忆 — 为什么用文件系统而非向量库,CLAUDE.md 分层与 handoff
- 05-向量检索记忆 — kNN-LM、Memorizing Transformer、embedding vs BM25、chunk 策略
- 06-记忆操作生命周期 — 构建/更新/查询三阶段、四原语、遗忘机制
- 07-生产记忆系统对标 — Mem0 / A-Mem / MemGPT / Hindsight 横评
- 08-记忆安全 — 投毒、跨会话污染、检索注入与治理原语
- 09-架构选型与决策 — 从任务特征到记忆栈:决策树 + archetype 落点 + 反模式自检
阅读建议
- 建立框架 → 先读 02-记忆分类体系 和 06-记忆操作生命周期,拿到分类坐标与操作骨架。
- 工程落地 → 03-compaction 和 04-文件型外置记忆 是生产 coding agent 的两条主路径。
- 选型与扩展 → 05-向量检索记忆 打底层,07-生产记忆系统对标 给系统横评,09-架构选型与决策 给可执行的选型流程。
- 风险评估 → 08-记忆安全。
参考资料
- Tang et al. LLM Agent Memory: A Survey from a Unified Representation-Management Perspective. Preprints.org 202603.0359, 2026.
- Sumers et al. Cognitive Architectures for Language Agents (CoALA). arXiv:2309.02427, 2023.
- Anthropic. Effective context engineering for AI agents / Harness design for long-running application development. 2025.
- Liu et al. Dive into Claude Code: The Design Space.... arXiv:2604.14228, 2026.
- 各子文档
## 参考资料段含完整引用。